#tiempo de inferencia

Escalado de cómputo en tiempo de prueba para ASR con Transformers en bucle

Optimiza el reconocimiento de voz con LARM: un Transformer en bucle que escala el cómputo en tiempo de prueba, mejorando la tasa de error de palabras.

2026-06-04 · 1 min

Latent Reward Steering: Marco Adaptativo para Comportamientos Cognitivos en LLMs

Descubre cómo Latent Reward Steering optimiza el razonamiento de LLMs al promover comportamientos cognitivos implícitos.

2026-06-02 · 3 min

Alineación humana y calibración de incertidumbre en LLMs

Descubre cómo las medidas de incertidumbre en tiempo de inferencia se alinean con la incertidumbre humana y mejoran la calibración en grandes modelos de lenguaje.

2026-06-01 · 2 min

Caracterización empírica de transformaciones de probabilidad en LLMs

Descubre cómo las transformaciones de probabilidad inducidas en tiempo de inferencia en LLMs siguen patrones log-ratio reproducibles. Un análisis empírico de 4,975 problemas.

2026-06-01 · 2 min